Python处理PDF神器PyMuPDF库

375次阅读

共计 440 个字符，预计需要花费 2 分钟才能阅读完成。

pip install PyMuPDF -i https://pypi.douban.com/simple/

import fitz  # 导入 PyMuPDF 库
filename = '100.pdf'
## 打开文档
doc = fitz.open(filename)

属性 / 方法	描述
Document.page_count	页数（int）
Document.metadata	元数据（dict）
Document.get_toc()	获取目录（list）
Document.load_page()	读取页面

page = doc.load_page(1)
links = page.get_links()  # 获取所有链接，返回字典列表
annots = page.annots()  # 获取注释
widgets = page.widgets()  # 获取表单字段
text = page.get_text('html')  # 获取页面信息
images = page.get_images()  # 获取图像列表值。列表中，元组第一位是 xref 值

正文完

Python

发表至：教程指南

2023年8月13日

转载说明：本站原创内容，除特殊说明外，均基于 CC BY-NC-SA 4.0 协议发布，转载须注明出处与链接。

JupyterLab+pyecharts天猫订单数据可视化项目

VS Code中使用Emmet语法快速编写HTML/CSS代码

超实用Python小项目

PHP命名空间

Python Web应用框架Django编程笔记

原码、反码、补码

评论（没有评论）

最新评论

阿伯手记发了：https://aboss.top/moments/1064

吴蛋蛋快发小年快乐

吴蛋蛋 Ask4Me，这个之前看server酱接入了

15220202929 怎么用

八对麻烦大佬更新下【堆新】的友链站名：八对星星描述：极目星视穹苍无界•足履行者大地有疆链接：https://8dui.com图标：https://cf.8dui.com/logo.webp横标：https://cf.8dui.com/logo-w.webp订阅：https://8dui.com/rss.xml

三毛笔记已添加

DUINEW 已添加贵站，期待贵站友链~博客名称：堆新博客地址：https://duinew.com/博客描述：堆新堆新,引力向新！——堆新（DUINEW）博客头像：https://d.duinew.com/logo.webp横版头像：https://d.duinew.com/logo-w.webp博客订阅：https://duinew.com/rss.xml